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(1 A-poäng) 


Del A 

1. (a) Konvertera talet 5BCi6 till den binära talbasen. 


Lösning: Tumregeln vid översättning från den hexadecimala talbasen till den 
binära talbasen är att översätta varje enskild position till ett fyrabitars binärt tal, 
och sedan sätta ihop alla delarna. För 5BCig får vi tre steg: 5i@ = 010l2,i?i6 = 
llio = 101 12 och Ci6 = 12io = IIOO 2 . Delarna är klara och det resultatet blir att 
5BCie = 101 1011 11002- Den första nollan tas bort eftersom den inte har någon 
signifikans. 


(b) Konvertera talet 5BCi6 till den decimala talbasen. (1 A-poäng) 


Lösning: Här finns två alternativ; antingen översätta direkt till den decimala 
talbasen eller att gå via det binära värdet som beräknades tidigare. En direkt 
översättning ger 5BCi6 = 5*16 2 + 11*16 1 + 12*16° = 5*256+11*16+12 = 1468io- 

Går man istället via den binära talbasen får vi 5BCi6 = 101 1011 IIOO 2 = 1 * 2 10 + 
1*2 8 + 1*2 7 + 1*2 5 + 1*2 4 + 1*2 3 + 1*2 2 = 1024+256+128+32 + 16+8+4 = 1468i 0 


2. (a) Illustrera hur man tar fram en Hammingkod för bitsträngen 1101. 


(1 A-poäng) 


Lösning: För en bitsträng med fyra bitar kommer en Hammingkod ge tre pa- 
ritetsbitar. Här används jämn paritet, men det går också bra att använda udda 
paritet. Varje fält är numrerat så att det framgår var delarna ur bitsträngen ska 
placeras i venndiagrammet. Numreringen kan göras på olika vis, så det finns fler 
korrekta svar. 



Med hjälp av venndiagrammet får vi ut bitsträngen 11011100, där de tre sista 
bitarna är paritetsbitarna. 


(b) Visa hur man använder Hammingkod för att korrigera fel som uppstått för en bit¬ 


strängen 1101. 


(1 A-poäng) 
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Lösning: Bilden nedan visar samma Hammingkod som ovan, men paritetsbiten i 
fält två har inverterats. 



Med hjälp av paritetsbiten i det sjunde fältet finner vi att ett av fälten 2,3 eller 4 
är inkorrekt. Paritetsbiten är 0, men bara en av de tre som ingår i bitsträngen som 
fält 7 kontrollerar är 1. Eftersom vi har jämn paritet bör det innebär att antingen 
fält 2 eller 4 bör vara en etta. 

Om vi därefter kontrollerar de två resterande paritetsbitarna ser vi att biten i fält 
6 fortfarande stämmer för fält 1,3 och 4. Paritetsbiten i fält 5 stämmer däremot 
inte. Den är 1, vilket tillsammans med en etta både i fält 1 och 4 ger fel när vi har 
jämn paritet. 

Vi letar efter gemensamma fält för de två paritetsbitar som inte stämde och ser 
att fält 2 och 4 är gemensamma. Eftersom fält 4 också ingår den cirkel som ger 
paritetsbiten i fält 6 kan inte fält 4 ha den felaktiga biten, eftersom fält 6 stämde. 
Därmed är det fält 2 som har den felaktiga biten, och vi kan korrigera genom att 
toggla det nuvarande värdet. 0 i fält 2 blir därmed 1. 


3. I en flerkärning processor där varje kärna har dedikerat cacheminne kan problem med 
cacheöverenstämnrelse (cache coherency) uppstå. Förklara hur den typen av problem kan 
uppstå. (2 A-poäng) 


Lösning: Problem kan uppstå som innebär att två eller fler dedikerade cacheminnen 
har olika värden sparade för samma minnesadress. Problemet kan uppstå oavsett om 
write back eller write through används som tillbakaskrivningsteknik för cacheminnet. 

Vid write back skrivs ändringar i första hand bara till cacheminnet och sparas inte i 
primärminnet för än cacheraden rensas ut ur cachen. Ponera att en processorkärna, pro¬ 
cessorkärna ett, läser in en referens från primärminnet som sparas i processorkärnans 
dedikerade cacheminne. När processorkärna ett sedan ändrar värdet på minnesplatsen 
så kommer ändringen att sparas i cacheminnet, men inte skrivas till primärminnet på 
grund av write back-tekniken. Vid en senare tidpunkt läser en annan processorkärna, 
processorkärna två, in samma minnesreferens som sparas i den processorkärnans de- 
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dikerade cacheminne. Nu har en situation uppstått där samma minnesreferens ligger 
sparad i primärminnet för både processorkärna ett och processorkärna två. Dock ligger 
olika värden sparade i de båda processor kär nornas dedikerade cacheminnen, därmed är 
inte de båda cacheminnena inte överstämmande. 

Om vi istället skulle använda write through kommer en förändring av värdet för en 
adress att skrivas till primärminnet och cacheminnet varje gång vi gör en förändring. 
Dock kan två kärnor ha hämtat värdet från samma adress tidigare, men bara den ena 
av dem ändrar värdet. Även om det värdet då skrivs tillbaka till primärminnet kommer 
den andra fortfarande ha det gamla värdet kvar i cachen. 

För illustrationer av båda fallen, se bilderna från föreläsning 13. 


4. Under de senaste 25 åren har processorns prestanda utvecklats exponentiellt. Prestandaut¬ 
vecklingen har både berott på att processortillverkarna har kunnat öka processorns klockpuls 
men också på grund av innovationer av processorns arkitektur. Ge exempel på två innova¬ 
tioner av processorns arkitektur som har ökat processorns prestanda under de senaste 25 
åren. (2 A-poäng) 


Lösning: Två exempel är pipelines och cacheminnen. Fler exempel finns i kapitel två 
i kursboken. 


5. Redundant Array of Independent Discs (RAID) är en serie av olika tekniker för att utnyttja 
synnergieffekter av flera hårddiskar. 

(a) RAID kan ge två olika typer av synnergieffekter, vilka? (1 A-poäng) 

Lösning: Snabbare läsning och skrivning av data samt redundans. 

(b) Välj en av de synnergieffekter du angett och förklara hur RAID tekniskt åstadkommer 

den. (1 A-poäng) 


Lösning: Gemensamt för alla typer av RAID är att de kräver en RAID-kontroller 
som sköter kommunikationen mellan de anslutna hårddiskarna och resten av da¬ 
torsystemet. 

Snabbade inläsning och skrivning av data nås genom att datorsystemet skri¬ 
ver filer till RAID-kontrollern som delar upp informationen i mindre delar och 
distribuerar dessa till de anslutna hårddiskarna. Man kan då läsa och skriva 
data parallellt och snabbar därmed upp läs- och skrivtiden. 

Redundans kan nås på två olika sätt. Den enklaste formen är att RAID-kontrollen 
delar upp informationen i mindre delar och skriver samma information till 
de anslutna hårddiskarna. 
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Ett alternativ som använder hårddiskutrymmet mer effektivt är att RAID- 
kontrollern sparar informationen samt paritetsinformation vilket innebär att 
bara en bråkdel av hårddiskutrymmet behöver användas jämfört med ovan 
nämnda teknik. 


6. Operativsystemet schemalägger processer utifrån tre olika tidsperspektiv. Beskriv kortfattat 

de tre tidsperspektiven. (2 A-poäng) 


Lösning: 

Långsiktig (long-term) schemaläggning 

Avgör om en process ska läggas till bland de processer som ska exekveras. 

Medellångsiktig (medium-term) schemaläggning 

Ar en del av operativsystmets minneshantering; den avgör vilka av en process 
sidor ska swappas in eller ut ur primärminnet. 

Kortsiktig (short-term) schemaläggning 

Avgör vilken av de tillgängliga processerna som ska exekveras av processorn. 


7. Beskriv de tjänster som Transmission Control Protocol ger jämfört med User Datagram 

Protocol. (2 A-poäng) 


Lösning: UDP ger möjligheten att använda portar så att en specifik process kan adres¬ 
seras, samt ger möjligheten att kontrollera om datat har förändrats under transporten 
med hjälp av en checksumma. I övrigt ger UDP inga tjänster utöver de som de undre 
lagren ger. 

TCP däremot erbjuder samma tjänster som UDP, men garanterar också att alla paket 
kommer fram och att man kan sätta ihop paketen i rätt ordning. Dessutom ser TCP till 
att inte översvämma nätverket eller skicka paket snabbare än mottagaren kan hantera. 


8. Moderna nätverk är paketväxlade, till skillnad från det gamla telefonnätet som är kretskopp- 

lat. Förklara skillnaden mellan paketväxlade och kretskopplade nätverk. (2 A-poäng) 


Lösning: I ett kretskopplat nätverk reserverar man en fast koppling från punkt A till 
punkt B. Trafiken kommer inte gå några andra vägar, och om kopplingen av någon 
anledning skulle brytas måste kopplingen sättas upp igen. 

I ett paketväxlat nätverk finns ingen förutbestämd väg mellan punkt A och punkt B, 
vägen bestäms vid varje vägskäl, något som kallas att välja väg hop-by-hop. Därför 
kan trafiken ta olika vägar genom nätverket. Om en av de mellanliggande kopplingarna 
skulle gå sönder kan trafiken automatisk ta en annan väg till punkt B, utan att hela 
uppkopplingen behöver göras om. 
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Del B 

1. Flyttal är ett sätt att representera stora, små och rationella tal. I nedanstående uppgift 
används standarden IEEE 754 för 16 bitars flyttal. Bilden nedan förklarar hur ett flyttal 
lagras binärt. 

tecken 
(1 bit) 


t 

15 

Figur 1: 16 bitars flyttal enligt IEEE 754 

(a) Beräkna operationen A+B. Svara med ett 16 bitars flyttal enligt IEEE 754. 

Flyttal A: 0 11000 0111000000 

Flyttal B: 0 11010 1011000000 (2 B-poäng) 

Formeln för att få ut det decimala värdet v ur ett flyttal: 

v = (-l) teckenbit x 2 exponent ~ 15 x (1 ,mantissa) 2 


exponent mantissa 

(5 bitar) (10 bitar) 



10 


0 


Lösning: För att kunna beräkna addition av två flyttal måste vi kontrollera att 
de båda termerna har samma exponent. Annars måste det minsta talet skiftas upp 
tills båda talen har samma exponent. Med hjälp av formeln ovan kan vi räkna ut 
exponenten för de båda talen. 

Flyttal A har exponentbitarna IIOOO 2 , alltså 24io- Enligt formeln ska vi subtrahera 
exponent värdet med 15, vilket ger 24-15=9. 

Flyttal B har exponentbitarna IIOIO 2 , alltså 26io- Återigen subtraherar vi expo¬ 
nentvärdet med 15 och får 26-15=11. 

De båda talen har inte samma exponent, vilket innebär att vi måste skifta ned 
mantissan två steg (11-9=2) för tal A. För att talet inte ska ändra värde måste 
mantissan minskas när vi ökar exponenten, vilket ger 1,0111 >> 0,10111 >> 
0,010111. Observera att den första ettan kommer ur formeln för flyttalet. 

När båda talen nu har samma exponent kan vi addera deras respektive mantissor. 

i F i i i 

0) ö I ö I I r 

+ 1, 1 0 1 1 0 0 

“i ö) ö - ö 0 0 I T 

Vi får resultatet 10,0000112, vilket är mantissan i det resulterande talet. Mantis¬ 
san behöver dock normeras eftersom alla tal enligt formeln ska ha följande form: 
1,mantissan. Vårt resultat just nu har formen 10,mantissan. Vi måste därför skifta 
ned resultatet ett steg, vilket ger 10,000011 >> 1,0000011. Eftersom vi skiftade 
ned mantissan måste vi öka exponenten. Exponenten var 11, ökas med 1 och blir 
12. Enligt formeln ska exponentbitarna vid uträkning subtraheras med 15, alltså 
måste vi nu öka 12 med 15, vilket ger 27. 27io = HOII 2 
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Både flyttal A och B var positiva, och vårt nya flyttal kommer därmed vara positivt. 
Därmed har vi samtliga fält klara och kan sätta ihop dem till ett helt flytta. 

A + B = 0 11011 0000011000. 


(b) I formeln ovan, tagen från IEEE 754 16 bit, tar man värdet i exponentfältet minus 15. 
Varför är formeln designad på det sättet? 


Lösning: I ett flyttal vill man kunna representera både stora och små tal. Det 
kan man göra genom att exponenten anger om decimalkommat ska flyttas framåt 
eller bakåt. Eftersom exponentbitarna inte har en teckenbit måste vi representera 
negativa tal på något annat vis. Med IEEE 754 gör man det med excess-k, där k 
är antalet bitar som anger exponentens värde. 

Om vi har 5 bitar för exponenten kan vi representera 0 till 32, utan negativa tal. 
Med excess-5 kan vi representera -15 till 16 (0-15 till 31-15). Vi får - 15 från följande 
formel: ( 2 antalet teckenbitary 2 - 1 = (2 5 )/2 - 1 = 32/2 - 1 = 15. Med hjälp av den 
formeln kan vi beräkna värdet för alla flyttal enligt IEEE 754, så länge vi vet hur 
många bitar exponenten utgör. 


(2 B-poäng) 


2. Anta att vi har en RISC-processor kallad DA_RISC med samma instruktionsuppsättning 
som NIOS Il-processorn. Eftersom det är en RISC-processor är majoriteten av alla instruk¬ 
tioner register-register-instruktioner. 

Instruktionscykeln för register-register-instruktioner består av två steg: 

• I: Instruction fetch. Instruktionen läses in och avkodas. 

• E: Execute. Instruktionen utförs och resultatet skrivs till det angivna resultatregistret. 
Instruktionscykeln för load och store-operationer består av tre steg: 

• I: Instruction fetch. 

• E: Execute. Beräknar minnesadressen. 

• M: Memory. Register-minne-operation eller minne-register-operation. 

Anta att nedanstående program körs av DA_RISC-processorn: 

1 _start : 


2 

rnovi 

r10, 20 

3 

movia 

r8, 0x4 

4 

movia 

r9, 0x20 

5 



6 

ldb 

rll, 0(r8 ) 

7 

addi 

i-12, rll, 1 

8 

beq 

i-12 , rl2 , SAVEJ4ESULT 

9 

sub 

i-12, rlO, rll 

10 

subi 

i-12 , rl2 , 1 
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rll , r12, rl2 


11 add 

12 SAVE_RESULT: 

13 stb rl2,0(r9) 

(a) Illustrera vilken/vilka pipeline hazards som uppkommer vid körning av programmet 

ovan. (2 B-poäng) 


Lösning: 


För att undersöka vilka pipeline hazards som uppkommer upprättar vi en tabell 
över hur instruktionerna kommer att exekveras i pipelinen: 


movi 

rlO, 20 

I 

E 









movia 

r8, 0x4 


I 

E 








movia 

r9, 0x20 



I 

E 







ldb 

rll, 0(r8) 




I 

E 

M 





addi 

rl2, rll, 1 





I 

E 





beq 

rl2, rl2, SAVE RESULT 






I 

E 




sub 

rl2, rlO, rll 










subi 

rl2, rl2, 1 











stb 

rl2, 0(r9) 








I 

E 

M 


Vi ser att i ovanstående exempel uppstår en data hazard när instruktionen addi 
rl2, rll, 1 använder informationen i rll innan dess att instruktionen Idb rll, 0(r8) 
har läst in informationen från minnet till rll samt att en control (branch) hazard 
uppstår vid mellan det att instruktionen beq rl2, rl2, SAVE.RESULT tills dess 
att branchmålet (instruktionen stb rl2, 0(r9)) är inläst i pipelinen. Instruktionen 
sub rl2, rl2 rll hinner läsas in i pipelinen och måste rensas ur så att den inte 
utförs, eftersom det skulle medföra att rl2 fick ett felaktig värde. 


Data hazard 



(b) Ange två tekniker som kan användas för att eliminiera hazarden eller minska risken 

att den inträffar som inte innebär att pipelinens prestanda påverkas negativt. (2 B-poäng) 


Lösning: Det optimala sättet att komma till rätta med de hazarder som uppkom¬ 
mer i exemplet ovan är att tillämpa delayed branch. Eftersom branchinstruktionen 
kommer att kräva två steg i pipelinen för att utföras kan vi lägga den före den 
instruktion som kommer innan, alltså addi rl2, rll 1. Om vi upprättar en tabell 
på samma sätt som tidigare över instruktionernas exekvering i pipelinen så blir 
resultatet följande (Vi låter markeringen för var de tidigare hazarderna uppstod 
kvarstå). 
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movi 

rlO, 20 

I 

E 








movia 

r8, 0x4 


I 

E 







movia 

r9, 0x20 



I 

E 






ldb 

rll, 0(r8) 




I 

E 

M 




beq 

rl2, rl2, SAVEJRESULT 





I 

E 




addi 

rl2, rll, 1 






I 

E 



sub 

rl2, rlO, rll 









subi 

rl2, rl2, 1 










stb 

rl2, 0(i'9) 







I 

E 

M 


Vi kan konstatera att data hazarden har eliminerats i och med att branchin- 
struktionen nu kommer mellan ldb- och addi-instruktionen. Även branch-hazarden 
har eliminerats då addi-instruktionen har lästs in i pipelinen och utförs och mål¬ 
instruktionen för branchen kommer att läsas in direkt efter att addi-instruktionen 
har lästs in. Sammanfattningsvis har vi med hjälp av delayed branch-tekniken eli¬ 
minerat båda de pipeline hazards som vi identifierade i första deluppgiften vsv. 

Andra exempel på tekniker som kan användas för att minska problematiken med 
branch hazards är exempelvis branch prediction. I vårt exempel skulle den statiska 
tekniken predict always taken ge ett utmärkt resultat eftersom branchens villkor 
alltid kommer att vara sant, och branchen därmed alltid att tas. I ett verkligt 
datorsystem måste man väga fördelarna som en dynamisk branch prediction teknik 
ger med den komplexiteten som de innebär att införa. 


3. I ett datorsystem behövs flera typer av minne för att lagra data och instruktioner, 
(a) Vi har följande avsnitt ur ett assembler pr ogram: 


1 

movia 

r8, 

0x357B40 



2 

ldw 

rlO , 

0 ( r 8 ) 

# 

0x357B40 

3 

ldw 

rll , 

16(r8) 

# 

0x357B50 

4 

ldw 

rl2 , 

40(r8) 

# 

0x357B68 

5 

stw 

rl3 , 

132(r8) 

# 

0x357BC4 

6 

ldw 

rl4 , 

8(r8) 

# 

0x357B48 

7 

stw 

rl5 , 

135 ( r8 ) 

# 

0x357BC7 

8 

ldw 

rl6 , 

6 4 ( r 8 ) 

# 

0x357B80 


Vi har också ett cacheminne med egenskaper enligt tabell 1. 


Storlek: 

128 byte 

Radlängd: 

16 byte 

Associativitet: 

2-vägs 


Tabell 1: Egenskaper för cacheminnet 


För varje instruktion som läser eller skriver till minnet ska du ange om det blir en träff 

eller miss i cacheminnet. (2 B-poäng) 
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Lösning: Först måste vi ta reda på hur många rader cacheminnet har: storle¬ 
ken/radlängden = 128/(16*2) = 4. Vi använder nämnaren 16*2 eftersom vi har 
ett två-vägsassociativt cacheminne, alltså två rader i bredd. 

För att kunna adressera 4 rader behövs två bitar (00-11). Vi har 16 bytes per rad, 
och för att kunna adressera dessa 16 bytes behövs fyra bitar (0000-1111). 

Utifrån dessa beräkningar kan vi dela in adressen i tag, rad och byte: 26 bitar för 
tag, två bitar för rad och fyra bitar för bytes. 

När vi har indelningen kan vi se om vi får en miss eller träff i cachen för koden 
ovan: 

Rad 2 Cacheminnet är alltid tomt från början, så vi kommer få en cachemiss 
vad som än händer. Vi kommer också läsa in data, och måste kolla vilken 
rad det ska in på: 0x357540 —> 40m = 01100|00002- Raden är 00, och på den 
raden lägger vi in data från adresserna 0x357B40 - 0x357B4F. 

Rad 3 Nästa adress är 0x357550 — > 50m = 0110110000. Rad 01 är tom och vi får 
en cachemiss. Vi läser in 0x357B50 till 0x357B5F. 

Rad 4 0x357568 —> 68m = 0111011000. Rad 10 är tom vilket ger en cachemiss. 
Vi läser in 0x357B60 till 0x357B6F. 

Rad 5 0x3575(74 — > (74m = 11|00|0100. Raden 00 är inte tom, men om vi jämför 
tag så är det heller inte rätt data som finns där. Det är dock bara en av 
mängderna som har data, och vi kan lägga in vårt nya data i den resterande 
mängden. Vi får en cachemiss och lägger in 0x357BC0 till 0x357BCF. 

Rad 6 0x357548 — > 48m = 01100| 1000. Raden är 00 igen, och vi kan med hjälp 
av tag se att matchande data finns i den första mängden på rad 00. Vi får 
därmed vår första cacheträff. 

Rad 7 0x3575(77 —> (77m = 11|00|0111. Raden är återigen 00, men den här 
gången finns korrekt data i den andra mängden. Ännu en cacheträff. 

Rad 8 0x357580 — »• 80m = 10|00|0000. Ännu en gång ska vi in på rad 00, men 
den här gången får vi en cachemiss eftersom taggen inte matchar det data 
som nu finns på rad 00. Data kastas ut från den första mängden på rad 00, 
och nuvarande data blir då 0x357B80 till 0x357B8F. 


(b) Vilka adresseringstekniker finns det för cacheminnen? Beskriv och jämför fördelar och 

nackdelar med de olika teknikerna. (2 B-poäng) 


Lösning: 

Direktmappad adressering är en snabb teknik för att adressera minne då man 
med hjälp av adressen direkt kan hitta rätt plats. Nackdelen är att om många 
adresser hamnar på samma rad behöver man kasta ut data ofta även om det 
finns plats ledigt. 

Associativ adressering adresserar inte alls baserat på adressen, utan lägger in 
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data på första lediga plats. Det gör att man utnyttjar hela minnesutrymmet, 
men gör å andra sidan att det tar lång tid att söka genom minnet. Om man 
har n rader i minnet kan man behöva söka igenom samtliga n rader innan 
man hittar det data man söker. 

Mängd-associativ adressering försöker utnyttja den snabbhet som finns med 
direktmappade minnen samtidigt som en viss associativitet ska göra att man 
inte behöver kasta data riktigt lika ofta. Ju fler mängder som används, desto 
längre tid tar det att söka hitta rätt data för en rad, men det är fortfarande 
effektivare än att söka igenom hela minnet. 


4. Anta att du fått i uppdrag att designa ett datorsystem som ska optimeras för att ge 
användaren en så bra upplevelse som möjligt. Det betyder att användaren ska uppleva 
att den kan interagera med datorsystemet utan att det upplevs som långsamt. Datorsyste¬ 
met måste naturligtvis ha stöd för multiprogramming så att användaren ha flera program 
i gång. 

(a) För att bestämma när olika processer ska köra används en schemaläggare. Beskriv 
hur en lämplig schemaläggningsalgoritm skulle välja ut vilken process som skulle få 
exekveras? Motivera ditt svar. (2 B-poäng) 


Lösning: Först behöver vi bestämma vilken kategori av schemaläggningsalgoritm 
som ska användas: kooperativ eller pre-emptiv. Kooperativa algoritmer låter pro¬ 
cesserna själva bestämma hur länge de ska köra, medan pre-emptiva tilldelar varje 
process en viss tid för exekvering. Eftersom vårt system ska vara interaktivt kan vi 
inte lita på att processerna själva kommer terminera på ett sätt som ger användaren 
upplevelsen av ett snabbt datorsystem. Därför väljer vi en pre-emptiv algoritm så 
att vi kan bestämma hur länge varje process får köra. 

Vår algoritm bör prioritera interaktiva processer, men bör samtidigt ge alla proces¬ 
ser möjligheten att köra så att vi inte svälter ut icke-interaktiva processer. Eftersom 
det inte finns något sätt att helt säkert veta vilka processer som är interaktiva är 
det en svår uppgift. 

Vad man kan göra är att försöka gissa vilka processer som är interaktiva. Exempel¬ 
vis kan man ge processer som kör ofta men inte speciellt länge en högre prioritet, 
då interaktiva processer behöver köra ofta, för att fånga upp inmatningar från 
användaren, men inte gör avancerade beräkningar. 


(b) I ett datorsystem kan man använda sig av tirne slices för att styra hur lång tid varje 
process får hos processorn. Vilka saker är viktiga att tänka på när du väljer hur lång 
varje tirne slice ska vara? Motivera ditt svar. (1 B-poäng) 


Lösning: Vi behöver tänka på att varje process behöver så pass lång tirne slice att 
de hinner få något gjort innan det är dags att byta, och vi behöver se till att con- 
text switch inte ger för mycket overhead eftersom vi då inte utnyttjar processorns 
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kapacitet i den mån vi skulle kunna göra. 

Vi måste dock se till att kravet på att systemet ska vara interaktivt styr, så att vi 
inte har för långa time slices. En lång time slice gör att användaren upplever att 
datorn inte reagerar på input från användaren, och vårt mål var att användaren 
skulle känna att vårt system är snabbt. Med det målet i åtanke ligger det närmre 
till hands att ha något kortare time slices, så att vi får en något högre througput 
och de interaktiva processerna kan köra oftare. 


(c) Virtuellt minne ger flera fördelar, och bland dessa finns möjligheten att låtsas att 
primärminnet är större än det egentligen är. Hur stort virtuellt minne skulle du ha, i 
förhållande till primärminnet? Motivera ditt svar. (1 B-poäng) 


Lösning: Här finns flera saker att ta hänsyn till. Hur vi än väljer storleken på vårt 
virtuella minne måste vi tänka på att alla sidor som inte får plats i primärminnet 
måste lagras på sekundär minnet. Därför måste vi se till att inte ta allt för stor 
del av sekundär minnet. En netbook har ofta väldigt lite sekundärminne, och se¬ 
kundärminne i form av SSD är dyrt och brukar därmed komma i mindre kvantiteter. 

Hur stort det virtuella minnet ska vara i förhållande till primärminnet beror på 
hur stort primärminnet är. Om vi har ett litet primärminne kommer vi inte kunna 
hålla allt för många processer i minnet, och ju större virtuellt minne vi har desto 
större är vår risk för thrashing. Om vårt primärminne är litet kan vi därför inte 
ha ett allt för stor virtuellt minne. 

Om primärminnet är stort och får plats med hyfsat många processer kan vi ha 
ett större virtuellt minne eftersom vi inte kommer att behöva swappa in sidor lika 
ofta. Då kan vi hellre ha ett större virtuellt minne och därmed tillåta fler processer 
som tar upp minnesresurser. 


5. I figur 2 finns en skiss av ett nätverk med flera subnät och olika nätverksenheter anslutna. 



Figur 2: Översikt över ett nätverk 

(a) Förklara hur trafiken flödar när Klient A vill ansluta till webbservern www.dsv.su.se. 

Du kan utgå från att Klient A inte vet vilken IP-adress webbservern har. Flera alter¬ 
nativa vägar existerar, redogör för samtliga av dessa vägar. (2 B-poäng) 
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Lösning: Eftersom klient A inte vet IP-adressen för www.dsv.su.se måste klient 
A först göra ett DNS-uppslag. Då kommer trafiken gå: Klient A —> Switch A —> 
Router A —>• Router D —> Switch D —> DNS-servern —> Switch D —> Router D —> 
Router A —> Switch A —>• Klient A, eftersom trafiken också måste gå tillbaka till 
Klient A från DNS-servern. Här finns flera alternativa flöden: Router A —> Router 
B —> Router D eller Router A —> Router C —> Router D. 

När Klient A nu vet IP-adressen till webbservern kan Klient A skicka paket direkt 
dit: Klient A —> Switch A —>• Router A —>• Router C —> Switch C —> www.dsv.su.se 
—> Switch C —> Router C —> Router A —> Switch A —> Klient A. Även här finns flera 
alternativa vägar: Router A -» Router B —> Router D —> Router C eller Router A 
—> Router D —»• Router C. 


(b) Beskriv och jämför fördelar och nackdelar med klient-server-arkitektur och peer-to- 


peer-arkitektur. 


(2 B-poäng) 


Lösning: 

Klient-server 

En fördel med klient-server är att all information bara behöver finnas på 
ett (eller åtminstone ett fåtal) ställen. En annan fördel är att en klient inte 
behöver vara lika ”smart” som en server, vilket gör att klienterna kan vara 
billigare och enklare. Det är också enklare att administrera en server jämfört 
med ett helt peer-to-peer-nätverk, och det är också enklare att ha kontroll 
på ett nätverk där klient-server-arkitekturen används jämfört med ett som 
använder peer-to-peer. 

Nackdelar är att om servern går sönder kan ingen använda serverns tjänster, 
och en server har högre kostnader för nätverkuppkoppling eftersom en server 
måste ha tillräckligt med bandbredd för den mängd användare som ens tjänst 
har. En server brukar också vara kraftfullare än en klient, vilket gör en server 
dyrare i inköpskostnad än en klient. 

Peer-to-peer 

Peer-to-peer är tänkt att lösa vissa av de problem som finns med klient-server- 
arkitekturen. Genom att sprida ut serverns uppgifter på flera peers undviker 
man problemet med att ha en enda punkt som kan fallera, och systemet 
blir därmed mer robust.. Det sprider dessutom kostnaden för bandbredden 
mellan peers. Om det exempelvis är en beräkning som ska utföras behöver 
varje peer inte ha lika avancerad och dyr hårdvara som en motsvarande server 
skulle behöva. 

Nackdelar med peer-to-peer är att om man till exempel har filer som delas ut 
i ett peer-to-peer-system är uppdateringar av en fil måste nå ut till samtliga 
peers, eller att man på något vis måste hålla koll på vilken version som är 
den senaste. Som en följd av detta kan en illvillig person eller organisation 
skicka in felaktigt data i ett peer-to-peer-nätverk för att störa eller sprida 
virus och liknande. 
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6. I ett lokalt nätverk kan man använda Ethernet för de nätverksenheter som använder en 
trådbunden anslutning. Moderna Ethernetenheter kopplas vanligen ihop med en switch. 

(a) Hur fungerar en switch, och vad är skillnaden mellan en router och en switch? (2 B-poäng) 


Lösning: En switch tar emot paket i nätverk och läser mottagaren fysiska (MAC) 
adress. Switchen skickar sedan paketet till rätt mottagare direkt, utan att skicka 
paket till någon annan enhet som är inkopplad i switchen. 

En router tar också emot paket, men skickar istället paket mellan två eller flera 
nätverk baserat på nätverksadressen, i regel IP-adressen. En router kan besluta vart 
ett paket ska skickas baserat på flera saker, exempelvis kostnad i tid och pengar. 

En switch jobbar med protokoll i länklagret, en router med protokoll i nätverkslagret. 
En switch vidarebefordrar bara paket till rätt mottagare, medan en router beslutar 
om en mottagare för ett paket baserat på kriterier. 


(b) Med hjälp av TCP/IP-modellen delar man in nätverksprotokoll i olika lager. Beskriv 
lagren samt ordna lagren i ordning från översta till understa lagret. Förklara också 
vilka fördelar man får av att dela in protokollen i olika lager. (2 B-poäng) 


Lösning: 

Applikationslagret 

Här finns protokoll som hanterar hur data ska representeras för att en appli¬ 
kation ska förstå det. 

Transportlagret 

Här finns protokoll som hanterar logisk överföring mellan två enheter, och 
här finns portarna som gör att man kan adressera en specifik process. 

Nätverkslagret 

Här finns protokoll som hanterar hur trafik skickas mellan två nätverk. 

Länklagret 

Här finns protokoll som hanterar hur enheter ska kopplas ihop i ett lokalt 
nätverk, och som ser till att kommunikationen mellan dem fungerar. Protokoll 
här måste hantera problem som att enheter får skicka data samtidigt och 
liknande. 

Att dela in nätverksprotokollen i olika lager ger att de ska vara oberoende av 
varandra. Oavsett vilket länklagerprotokoll som används man kan skicka trafik 
mellan olika nätverk med hjälp av Internet Protocol. Oavsett vilket transportlager- 
protokoll som används kan en applikation skicka data, precis som att en applikation 
inte är beroende av att enheten är uppkopplad med ett visst länklagerprotokoll. 
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